トップ > GoDriveOCR

GoDriveOCR

メニュー

GoDriveOCR とは

トップイメージ
※本アプリを使用する前に、Google ドライブのOCR機能を利用するための事前準備が必要です。この設定が適切に行われていない場合は、本アプリを使用することができませんので、必ず設定してください。設定方法は、「事前準備の手順」をご覧ください。また、当然ですが、Googleのアカウントが必要になりますので、お持ちでない場合は、事前に作成してください。
合わせて、「注意事項」も必ずお読みください。

Google ドライブ」には、OCR(文字認識)機能があり、精度の高い認識結果を得ることができますが、通常、その機能を利用するには、インターネットブラウザからGoogle ドライブにアクセスし、ファイルをアップロードし、OCRを実行した後に、結果をダウンロードするという手順になり、ファイルが多数ある場合は非常に繁雑で時間もかかる作業になります。GoDriveOCRは、これらの「画像のアップロード・文字認識・結果のダウンロード」までの一連の作業をインターネットブラウザを介さず、自動で行うアプリケーションです。OCRを行いたい画像ファイルを登録し、ボタンをクリックするだけで認識結果を取得することができます。また、画像認識を行いたいファイルを複数事前に登録しておき、連続して一気に認識させることが可能です。さらに、OCRを行う際、「画像のこの部分だけ認識させたい」といった範囲指定も可能で、その範囲もそれぞれの画像につき複数指定することができます。

Google Drive APIを用いて文字認識を行う際、ファイルのアップロードや結果のダウンロードなどのファイル操作に時間が掛かります。例えば、100行のテキスト画像と1000行のテキスト画像をそれぞれ認識させた場合、処理時間は体感的にはほとんど変わりません。従って、ファイル数が多いとそれだけファイル処理にかかる時間も大きくなり、これが大きなオーバーヘッドになります。そこで本アプリでは、複数の画像を1枚に合成し、一気に認識させることで処理を高速化することもできます。※注1

PDFの画像を読み込む場合、「画像に変換して読み込む」処理と、「そのまま読み込む」処理を選択できます。また、画像に変換する場合、含まれるページを展開して読み込むこともでき、その場合、ページの指定や範囲を指定することも可能です。※注2

ファイルだけでなく、画面のキャプチャ機能も備えていますので、画面上の認識したい範囲をキャプチャして認識させることもできます。

簡易的な画像編集機能も備えていますので、画像認識を行う前に不要な部分の消去するといった簡単な画像編集を行うことも可能です。

認識結果は、プレーンテキストになりますが、一括置換設定をしておけば、認識後に自動的に文字置換をすることができます。置換には「正規表現」を使うことも可能ですので、高度な置換処理も行えます。一括置換設定は複数設定することができます。

GoogleのAPIを用いたOCRと言えば、Google Cloud APIを使う方法もありますが、これを利用するには、クレジットカードなどの課金設定をする必要があり、1ヶ月の利用数が一定数以上になると料金が発生するのに対して、Google Drive APIを使ったOCRは完全に無料で利用でき、課金の設定も必要ありません。Google Cloud APIと比較した場合の欠点としては、Google ドライブを介しての処理のため、結果が得られるまで少し時間がかかることです。


※注1:画像枚数が多く、合成した際のファイルサイズが大きい場合は、複数枚に分割して認識します。
※注2:PDFをそのまま読み込む場合は、画像の編集はできません。また、サイズの大きなPDFは認識できない場合があります。

主な機能

動作環境

※注3:Windows 11では標準でインストール済のため不要。Windows 10の場合は本アプリのインストーラからインストール可能

ダウンロード

バージョン 改版履歴 リリース日
ダウンロード Ver.1.2.1 ダウンロード
  • 画像編集画面を閉じたときに、アプリが落ちることがあるバグを修正
  • スクリーンキャプチャーの際に、「グレースケールに変換する」が設定されていても、変換されないバグを修正
2024年11月14日
ダウンロード Ver.1.2.0 ダウンロード
  • クリップボードの監視機能追加
  • メインメニューに「スクリーンキャプチャ」のボタン追加
  • パスワード保護されているPDFを読み込んだ場合にフリーズするバグを修正
  • 編集画面からでも結果のフォント設定、改行マーク表示の有無を変更できるようにした
  • 未対応ファイルを読み込んだ場合、エラーメッセージを表示せず無視するよう変更
  • その他細部修正
2024年11月4日
ダウンロード Ver.1.1.1 ダウンロード
  • メイン画面のコンテクストメニューを開くと、環境によってアプリが落ちることがあるバグを修正
2024年10月6日
ダウンロード Ver.1.1.0 ダウンロード
  • 画面キャプチャ機能追加
  • メイン画面のコンテクストメニューに、「プログラムから開く」機能を追加
  • 「画像を保存」で、保存画像の拡張子が必ずpngになるバグ修正
  • その他細部修正
2024年11月20日
ダウンロード Ver.1.2.1 ベクターサイトからダウンロード

事前準備

本アプリは、Google ドライブのフォルダにアクセスし、OCR機能を利用しますが、そのためには事前にそれらの機能を利用できるように設定する必要があります。この設定を済ませておかなければ、本アプリを使用することができませんので、以下の手順に従って、本アプリをインストールする前に必ず設定を行ってください。
事前準備については別ページにまとめましたので、そちらを参考に設定してください。 >>>事前準備の手順

インストール

本アプリ「GoDriveOCR」をインストールします。
ダウンロードした「GoDriveOCR_Vxxx(.exe)」を実行してください。(xxxはバージョン番号)
Windows Defender Smartscreenによって、警告が表示された場合は、「詳細情報」をクリックして、実行を許可してください。
実行」をクリックするとインストールが始まります。
指示に従って、インストールしてください。

Microsoft Edge WebView2のインストールに関して

本アプリは、PDFをそのままアップロードして認識する機能があります。その場合、画像の編集はできませんが、表示をさせるために、Microsoft Edge WebView2のランタイムを使用しています。
Windows 11の場合は、標準でインストールされているのでインストールする必要はありません(インストールしても問題ありません)。
Windows 10の場合、すでにインストールされている場合は不要ですが、インストールされているか不明な場合は、後からインストールできますので、チェックを外しても構いません。また、PDFの表示機能が必要ない場合、または、WebView2のランタイムをインストールしたくない場合は、「コンポーネントの選択」画面で、「Microsoft Edge WebView2ランタイムインストール」のチェックを外してください。(※Windows 10にインストールすると、現在のランタイムのバージョンでは簡単にはアンインストールできないようです。Windows 11では標準でインストールされていますので、危険なアプリではありません。

インストール画面

初回起動時の設定

インストール後、初回起動時に、Google ドライブにアクセスするための設定が必要です。
OK(O)」をクリックして次に進みます。
Googleドライブ設定」を行います。
まず、「Googleドライブフォルダ名」が「Googleドライブの作業用フォルダの作成と共有設定」のところで作成した共有フォルダの名前と同じであることを確認してください。共有フォルダを作成した際に、「GoDriveOCR」とは違う名前で作成した場合は、そのフォルダ名を入力します。名前が一致していないと、エラーになりますので注意してください。

Googleドライブフォルダ名設定

赤字で「ここに、JSONキーファイルをドラッグ&ドロップしてください。」と書かれた所に、「事前準備の手順」でダウンロードしたJSONキーファイルドラッグ&ドロップします。

JSON Keyファイルの設定

正しく設定出来れば、「設定済」の表示に変わり、「GoogleドライブフォルダID」に、共有フォルダのIDが表示されます。
動作確認」をクリックして、正常に認識できるか確認します。
OCR実行中(動作確認)」のダイアログが表示されます。
認識成功」のダイアログが表示されれば、設定完了です。「OK(O)」をクリックして、設定を終了します。
Googleドライブの共有フォルダの設定に問題があります。」というエラーが出た場合は、
の、いずれかが考えられます。本アプリの設定で「Googleドライブフォルダ名」を確認し、問題なければ、「Googleドライブの作業用フォルダの作成と共有設定」の共有の設定で、「アクセスできるユーザー」が正しく設定されているかを確認してください。それでも同じエラーが出る場合は、「Google API サービスアカウントの認証キー」をもう一度作成してダウンロードし、設定の「Googleドライブ設定」の「JSON Keyファイル」に、新しく作成したファイルをドラッグ&ドロップし、再設定してください。
Google API サービスアカウントの認証キー」は、「鍵を追加」で新しく作成することができます。

アンインストール

メニューの「GoDriveOCR」のグループから「アンインストール」を実行するか、設定の「アプリと機能(クリックすると設定画面を表示します)からアンインストールしてください。
設定ファイルも削除しますか?」のメッセージが表示された場合、「いいえ」をクリックしてすると、設定ファイルを残して本体のみ削除します。「JSONファイルも削除しますか?」のメッセージが表示された場合、「いいえ」をクリックしてすると、JSONファイルを残して本体のみ削除します。設定ファイル、JSONファイルのいずれかを残した場合、ユーザーデータフォルダに本アプリの設定データが残されたままになり、その後、再度本アプリをインストールした際に、前回の設定が引き継がれます。設定だけクリアしたい場合や、JSONファイルだけ更新したい場合にご利用下さい。完全に削除したい場合は、両方とも「はい」をクリックしてください。

使用方法

画像を開く

起動時に、インターネット接続とGoogle ドライブへのアクセスのチェックを行いますので、起動に少し時間が掛かる場合があります。
画像を開く(O)」か、メニューの「ファイル(F)」-「画像を開く(O)」で、画像を選択するダイアログが表示されますので、OCRを行いたいファイルを読み込みます。クリップボードに有効な画像データがある場合は、「クリップボード(B)」でも可能です。
正常に読み込まれると、サムネイル画像が表示されます。 画像は、幅、高さのいずれか大きい方が、2400ピクセルより大きい場合は、2400ピクセルに縮小して読み込みます。
読み込んだ画像は、全て作業用フォルダに一時的にコピーされますので、リストから削除したり画像を編集しても、元の画像に影響は一切ありません。
PDFを読み込ませた場合、次のようなダイアログが表示されます。

処理選択ダイアログ

Google ドライブでは、通常の画像ファイルの他に、PDFも認識できますので、そのままアップロードして認識させるか、画像に変換してから認識させるか選択できます。
画像に変換してから読み込む(I)」を選択した場合は、画像に変換してから読み込まれます。「そのまま読み込む(I)」を選択した場合は、画像に変換せずにそのまま読み込みます。その場合は、画像のサムネイルは表示されず、PDFのアイコンになります。
PDFを読み込ませた際のデフォルト動作は、設定の「基本設定」で、「都度選択する」、「画像に変換して読み込む」、「そのまま読み込む」のいずれかから設定出来ます。「都度選択する」以外に設定すると、このダイアログは表示されず、設定した処理を行います。

PDFをそのまま読み込んだ場合

複数ページで構成されているPDFを画像に変換して読み込む場合、変換するページを指定するダイアログが表示されます。
全ページ(A)」を選択すると、全てのページを画像に変換して読み込みます。「ページ指定(R)」を選択すると、読み込むページを指定できます。ページの指定には、「1,3,6」の様に直接ページを指定したり、「4-8」の様に範囲を指定することもできます。「2,5,10-25」といった指定も可能です。 マルチページのTIFFを読み込む場合も同様に、ページ選択のダイアログが表示されます。

ページ選択ダイアログ

ファイルを開くためのパスワードが設定されているPDFを読み込んだ場合、パスワード入力を求めるダイアログが表示されます。パスワードを入力すると、画像に変換して読み込みます。
※パスワード保護されているPDFはそのままアップロードすることはできませんので、必ず画像に変換されます。

パスワード入力ダイアログ

スクリーンキャプチャ

パソコンの画面をキャプチャして、認識させることができます。
スクリーンキャプチャを開始すると、本アプリが非表示になり、画面全体が暗くなります。マウスの左ボタンをクリックして開始点を指定し、ドラッグして範囲を指定します。指定された範囲は明るくなり、終点でマウスのボタンを放すと、その範囲が取り込まれます。ESCキーでキャンセルできます。
マルチモニタにも対応しています。

スクリーンキャプチャ

クリップボード監視

メニューの「設定」-「クリップボード監視」、もしくは、ステータスバーの「クリップボード監視」をクリックしてオンにすることにより、クリップボード監視モードがオンになります。
クリップボード監視」がオンの場合、他のアプリ等で画像をクリップボードにコピーすると、自動的に本アプリに取り込みます。エクスプローラでファイルをクリップボードにコピーした場合にも自動的に取り込まれます。対応したファイル以外は無視されます。画像編集画面を表示している場合は監視機能は働きません。

画像編集

リストのサムネイル画像をダブルクリック(左ボタン)、メインメニューの「編集(E)」-「画像を編集(E)」、コンテクストメニューの「画像を編集(E)」のいずれかで、画像編集画面が表示されます。
パソコンにインストールされている他の画像編集ソフトで編集したい場合は、コンテクストメニューの「プログラムから開く(H)」から、編集したいソフトを選びます。
※パソコンにインストールされているにも関わらず、リストにそのソフトが表示されない場合は、エクスプローラーの「プログラムから開く(H)」を実行し、編集したいアプリで1度画像を読み込ませてください。以降は、リストに表示されます。

表示

メニューの「表示(V)」で、画像リストの表示方法を変えることができます。
表示方法は、「大アイコン」、「小アイコン」、「一覧」、「詳細」の4つあります。
詳細」の表示の場合は、認識結果も表示されます。

大アイコン

小アイコン

一覧

詳細(※認識実行後)

一括OCR(順次認識)

メインメニューのリストに登録されている画像を連続で一気に認識させるには、「一括OCR(A)」をクリックします。
クリックすると、確認のダイアログが表示され、「はい」をクリックすると、登録されている画像を全て順に処理します。
登録されている画像が順に認識されます。
認識終了後、それぞれの画像を開くと、右ウインドウに結果が表示されます。

一括OCR(結合認識)

リストの左の□にチェックを入れた状態で「一括OCR(A)」をクリックすると、チェックされている画像を1枚に結合して認識します。
Google Drive APIを用いて文字認識を行う際、ファイルのアップロードや結果のダウンロードなどのファイル操作に時間が掛かります。例えば、100行のテキスト画像と1000行のテキスト画像をそれぞれ認識させた場合、処理時間は体感的にはほとんど変わりません。従って、ファイル数が多いとそれだけファイル処理にかかる時間も大きくなり、これが大きなオーバーヘッドになります。そこで、複数の画像を1枚に合成し、一気に認識させることで処理を高速化することができます。
ただし、Google ドライブでのOCRの制限で、ファイルサイズが大きい場合はうまく認識できません。色々試してみた結果、通常の画像ファイルであれば、10MByte程度までなら認識できるようです。本アプリでは、1ファイルが9MByte以下になるようにファイルを複数枚に分けて合成して認識させます。PDFの場合は、チェックを付けても合成せずにそのままアップロードします。PDFの場合は15MByte程度までは認識できるようです。
※□にチェックを入れた場合、チェックの付いたファイルのみ認識を実行します。チェックの付いていない画像は認識されませんのでご注意ください。

結合認識のデメリット

結合認識は高速で認識処理ができますが、デメリットがあります。
OCR認識枠を指定せず、複雑なレイアウトの画像を結合して認識した場合、レイアウトが崩れて認識されることがあります。(通常通りの認識でも、複雑なレイアウトの場合はレイアウトが崩れることが多いです。)その場合は、なるべく細かくOCR認識枠を指定するか、単独で認識させてみてください。

終了

通常の終了

終了(Q)」ボタンをクリックするか、フォーム右上の「×」をクリック、もしくは、メニューの「ファイル」-「終了(Q)」で終了します。

リストをクリアして終了

初期設定では、「クリアして終了(C)」ボタンはグレー状態でクリックできません。
設定」-「基本設定」の「前回の状態を復元して起動する(E)」にチェックを入れるとクリックできるようになり、基本設定の「前回の状態を復元して起動する(E)」にチェック入っている場合でも、リストを全てクリアして終了します。

個別認識の実行

一括認識ではなく、個別に認識させたい場合は、認識させたい画像を選択し、メインメニューの「編集(E)」-「OCR実行(O)」、または、マウス右クリックで表示されるコンテクストメニューの「OCR実行(O)」で可能です。
または、リストのサムネイル画像をダブルクリック(左ボタン)、メインメニューの「編集(E)」-「画像を編集(E)」、コンテクストメニューの「画像を編集(E)」のいずれかで、画像編集画面を表示し、「認識実行(O)」をクリックすることで個別に認識を行うことができます。
この状態で、「認識実行(O)」をクリックすると、OCRが実行されます。実行中には、画面下に進行状況を表すプログレスバーが表示されます。

認識実行中画面

PDFをそのまま読み込んだ場合は、次のような画面になります。この場合は、編集やOCR認識枠を設定することはできません

PDF表示画面

Windows 10で、WebView2のランタイムがインストールされていない場合は、次のような画面になります。
ランタイムをインストールする場合は、「ランタイムをインストール」をクリックすると、インストーラが起動します。ランタイムのインストールが終了すると、メイン画面に戻り、もう一度開くと表示されます。

WebView2 未インストールの場合(Windows 10)

メニューの「設定(S)」-「一括置換オン」をクリックしてチェックを付けるか、画面下の「一括置換オフ」をクリックすることにより、基本設定の「OCR実行後に、自動的に一括置換を行う(R)」の設定に関係なく、一時的に一括置換のオン・オフが切り替えられます。(一括置換の設定がされていない場合は、オンにしても何もしません。)

一括置換の一時的なオン/オフの切り替え

認識が終了すると、右ウインドウに結果が表示されます。

拡大・縮小

マウスホイールで、画像の拡大、縮小ができます。マウスを右クリックしてドラッグすると、移動できます。
20%〜400%まで拡縮できます。

画像の移動

表示されている画像が画面に入りきらない場合は、スクロールバーを移動させるか、マウスの右ボタンを押してドラッグすることで、自由に移動できます。

OCR範囲指定認識

全体ではなく、指定した範囲のみを認識させたい場合は、マウスの左クリックで範囲選択を開始し、ドラッグして範囲指定します。認識範囲は複数設定でき、左上に表示されている数字は認識する順番になります。
選択範囲は、ドラッグによる移動、さらに枠の端をドラッグすることで、拡大、縮小が自由にできます。範囲を削除する場合は、削除したい枠をクリックして(アクティブ)にして、メニューの「編集」-「削除(D)」か、コンテクストメニューの「削除(D)」、もしくはキーボードの「Delete」を押すことで削除できます。
この状態で、「認識実行(O)」をクリックすると、選択範囲のみ認識されます。認識結果は、範囲の右隅に表示されている数字の順番で認識されます。

OCR認識枠の順序変更

認識範囲の順番を変えたいときは、メニューの「編集(E)」-「枠の順序変更(O)」、もしくはマウスの右クリックで表示されるコンテクストメニューの「枠の順序変更(O)」を実行します。
OCR認識枠の順序変更」のモードになると、枠の色が青色に切り替わります。認識させたい順番に青枠をクリックしていきます。クリックして順番を決定した枠は、数字が黒色に変わります
全ての枠を選択し終わると、通常の赤色に戻ります。この状態で「認識実行(O)」をクリックすると、指定された枠の順で認識されます。

画像編集

認識実行前に、不要な部分を削除したり、移動したりといった簡易的な画像編集が可能です。(※PDFをそのまま読み込ませた場合は編集出来ません。画像の編集は、一時フォルダにコピーされた画像に対して行いますので、読み込ませた元の画像には一切影響はありません。
編集モード」にするには、「認識実行」ボタンの右にあるをクリックします。クリックすると、「編集モード」に変わります。

編集モード画面

基本操作

マウスの左クリックで、範囲の始点を決定し、そのままドラッグすると、青色の枠で範囲が選択されます。

範囲選択画面

その状態で、枠の端や角を左クリックしてドラッグすると、範囲の拡大・縮小ができます。
Delete」キーを押すと、範囲の画像が削除されます(背景色で塗りつぶされます)。

選択範囲の拡大/縮小

枠内をクリックすると、「移動モード」になり、ドラッグで範囲の移動ができます。

選択画像の移動

「移動モード」中に、枠の端や角をドラッグすると、移動中の画像の拡大・縮小ができます。「Shift」キーを押したままドラッグすると、アスペクト比を維持して拡大・縮小できます。
範囲以外をクリックすると、移動が決定されます。決定前に「ESC」キーを押すと、元の状態に戻ります。

選択画像の拡大/縮小

キーボードによる画像の操作

画像のコントロールにフォーカスがある状態で、キーボードにより以下の操作ができます。
  • カーソルキー:画像の移動
  • Shift+カーソルキー:画像の移動(高速)
  • Ctrl+↑:拡大
  • Ctrl+↓:縮小
  • Ctrl+V:クリップボードの画像データの貼り付け
範囲選択状態(移動中は除く)では、以下の操作が可能です。
  • Ctrl+C:選択範囲をクリップボードにコピー
  • Ctrl+X:選択範囲を切り取る

アイコンメニュー

画像編集メニューのアイコンには、以下のような機能があります。

画像編集メニュー

モード切り替え

クリックで「編集モード」と「OCR範囲設定モード」を切り替えます。

左回転

画像を左回転します。
※「OCR範囲指定」をしている場合は、画像に合わせて枠も回転されます。

左回転

右回転

画像を右回転します。 ※「OCR範囲指定」をしている場合は、画像に合わせて枠も回転されます。

右回転

傾き補正

クリックすると、マウスカーソルが「×」になり、「傾き補正モード」になります。
左クリックで、始点を決め、水平にしたいラインに合わせて終点を決めた後に、画面上の任意の場所を左クリックするとその角度に合わせて、画像を回転します。
途中でに右クリックすると、1つ前の状態に戻ります。

傾き補正

トリミング

トリミングしたい範囲を指定した状態でクリックすると、指定された範囲にトリミングされます。
※「OCR範囲指定」をしている場合は、確認のメッセージが表示され、「はい」をクリックすると全ての範囲が消去されます。

トリミング(実行前)

トリミング(実行後)

切り取り

切り取りたい範囲を指定した状態でクリックすると、指定された範囲が削除されます(背景色で塗りつぶされます)。「Ctrl+X」や「Delete」キーでも削除できます。

切り取り(実行前)

切り取り(実行後)

アンドゥ

1つ前の状態に戻します。(最大10回前まで)

クリップボードにコピー

範囲を指定した状態でクリックすると、指定された範囲がクリップボードにコピーされます。「Ctrl+C」キーでも可能です。

貼り付け

クリップボードに有効な画像データがある状態でクリックすると、クリップボードの画像が貼り付けできます。「Ctrl+V」キーでも可能です。
枠内をドラッグすると、好きな場所に移動できます。枠の端や角を左クリックしてドラッグすると、拡大・縮小ができます。「Shift」キーを押したままドラッグすると、アスペクト比を維持して拡大・縮小できます。枠以外の場所を左クリックすると決定します。

編集モード切り替え

消しゴムツールモード」から、範囲を選択し、削除、移動、拡大・縮小を行う「編集モード」に切り替えます。

消しゴムツールモード切り替え

消しゴムツールモード」に切り替えます。「消しゴムツールモード」になると、「消しゴムカーソル」が選択できるようになり、マウスカーソルが「消しゴムカーソル」で選択された形、サイズに変わります。左クリックで消去し、ドラッグで連続して消去することができます。

消しゴムカーソル切り替え

消しゴムカーソル」の形状、サイズを選択します。

認識結果編集

右画面には、認識結果が表示されます。
Ctrl+Z」で「アンドゥ」、「Shift+Ctrl+Z」で「リドゥ」ができます。
フォントやフォントサイズ、色などの設定はメインメニューの「設定(O)」-「表示設定(C)」のタブでできます。
認識結果編集メニューのアイコンには、以下のような機能があります。
L「検索
M「置換
N「一括置換
O「一括置換設定
P「クリップボードにコピー

検索

クリックすると、検索ダイアログが表示されます。
検索文字」に検索したい文字(文字列)を入力し、「検索方向」を指定して「次を検索(F)」をクリックします。検索は、現在のカーソル位置から検索されます。
正規表現(G)」にチェックを入れると、正規表現を用いた高度な検索ができます。「正規表現」の詳細については、ウェブで検索してください。
大文字・小文字無視(I)」にチェックを入れると、アルファベットの大文字・小文字を無視して検索します。
検索条件にヒットすると、その箇所が選択状態になります。

置換

クリックすると、置換ダイアログが表示されます。
検索文字」に検索したい文字(文字列)、「置換文字」に置換したい文字(文字列)を入力し、「開始位置」を指定して「次を置換(N)」をクリックします。
正規表現(G)」にチェックを入れると、正規表現を用いた高度な検索ができます。「正規表現」の詳細については、ウェブで検索してください。
大文字・小文字無視(I)」にチェックを入れると、アルファベットの大文字・小文字を無視して検索します。
確認しながら置換」にチェックが入っている場合は、検索文字列にヒットした箇所が選択状態になり、確認用のダイアログが表示されます。

一括置換

一括置換設定」で設定された置換条件を連続して一括置換します。実行する前に、「一括置換設定」で置換設定を登録しておく必要があります。
メインメニューの「設定」-「基本設定」のタブで、「OCR実行時に、自動的に一括置換を行う(R)」にチェックが入っている場合は、認識実行後、自動的に一括置換が行われます。

一括置換設定

一括置換設定」で実行する置換の設定を行います。
クリックすると、次のダイアログが表示されます。
検索文字」と「置換文字」を登録して、「追加」をクリックします。正規表現を使用する場合は、「正規表現」のチェックボックスにチェックを入れます。「コメント」は、置換内容を覚えておくためのもので、入力しなくても構いません。
追加すると、下のリストに表示されます。
削除したい場合は、削除したいリストを選択して「削除」ボタンをクリックします。
一括置換は、リストの上から順番に実行されます。置換順序を変更したい場合は、リストを選んで、希望する位置にドラッグ&ドロップします。
既に登録されている設定を修正したい場合は、編集したい項目をクリックするか、「F2キー」で直接編集出来ます。
有効」のチェックボックスのチェックを外すと、リストから削除せずに一時的に無効にできます。

クリップボードにコピー

クリックすると、認識結果がクリップボードにコピーされます。

各種設定

メインメニューの「設定(O)」-「設定(C)」で、「各種設定」のダイアログが表示されます。
各種設定」のダイアログには、「Googleドライブ設定」、「基本設定」、「表示設定」の3つのタブがあります。

基本設定タブ

本アプリの基本的な動作設定を行います。

グレースケールに変換して画像を読みこむ(G)

チェックを付けると、メインメニューに画像を追加する際に、画像をグレースケールに変換してから読み込みます。画像サイズが大きい場合は、読み込みに少し時間が掛かります。

起動時に、インターネットに接続されていなければメッセージを表示する(I)

チェックを付けると、起動時にインターネットに接続されていなければ、その旨を表示するダイアログが表示されます。
初期設定でチェックが入っています。

OCR実行後に、自動的に一括置換を行う(R)

チェックを付けると、認識実行後に、「一括置換設定」で設定した一括置換設定を自動的に行います。

クリップボードにコピーする際に、ファイル名を挿入する(C)

チェックを付けると、認識結果をクリップボードにコピーする際に、先頭にファイル名を挿入します。
認識結果をクリップボードにコピーするには、対象のファイルを選択し、右クリックで表示されるコンテクストメニューの「認識結果をクリップボードにコピー(C)」をクリックします。画像の□にチェックを入れた状態でコピーすると、チェックの付いた画像の認識結果がコピーされ、その際に、各結果の先頭にファイル名が挿入されます。

前回の状態を復元して起動する(E)

チェックを付けると、メインメニューを終了時に、編集画像や認識結果を保存して終了し、次回起動時にはその状態を復元して起動します。画像の編集途中や、認識結果を編集中に作業を中断したい場合に便利です。
この機能を有効にすると、メインメニューの「クリアして終了(C)」のボタンがクリックできるようになり、これをクリックして終了すると、リストを全てクリアして終了します。
チェックを外すと、メインメニュー終了時に編集中の画像や認識結果は全て破棄されます。

終了時に、更新確認のメッセージを表示する(F)

画像の編集が行われていたり、認識結果がある場合は、終了時に確認のメッセージが表示されます。
チェックが付いている状態でも、メインメニューの「クリアして終了(C)」をクリックすると、リストをクリアして終了することができます。
初期設定でチェックが入っています。

認識範囲選択した場合に、範囲毎に改行を挿入する(N)

認識範囲の選択を2つ以上した場合、認識された範囲毎に改行を挿入することができます。チェックを付けると、「改行数(U)」が編集出来る状態になり、挿入したい改行数を設定出来ます。
通常(チェックが付いていない状態)では、次のように選択範囲の認識結果には改行挿入されません。
改行数(U)」を「1」に設定すると次のように、範囲毎に1行改行が追加されます。
改行数(U)」を「2」に設定すると次のように、範囲毎に2行改行が追加されます。

PDFの動作(P)

PDFを読み込ませた場合の、デフォルトの処理方法を設定します。
都度選択する」に設定すると、PDFを読み込む度に、処理選択のダイアログが表示され、画像に変換して読み込むか、そのまま読み込むかを選びます。「画像に変換して読み込む」に設定すると、常に画像に変換して読み込みます。複数ページのPDFの場合は、ページ選択のダイアログが表示されます。「そのまま読み込む」に設定すると、画像に変換せず、そのまま読み込みます。

デフォルト認識言語(L)

認識を行う際に、Google Drive APIが判断の基準とする言語です。
Google Drive APIの公式の仕様には、「hints at the language to use」とあり、あくまでも認識を行う際の「ヒント」に過ぎませんので、ここで設定された言語で認識結果が得られるという訳ではありません。例えば、全て日本語の画像を「英語」の設定にして認識させても「日本語」の結果が得られます。
認識結果にはあまり影響がありませんが、通常で使用している(求める認識結果の)言語を設定しておきます。

作業用フォルダを指定する(T)

本アプリで使用する作業フォルダを指定します。通常は設定する必要はありませんが、作業用フォルダを指定したい場合は、チェックすると「フォルダ選択(M)」ボタンがクリックできるようになり、クリックして表示されるダイアログで、作業用フォルダを指定します。この設定は、次回起動時から有効になります。「前回の状態を復元して起動する(E)」の設定を有効にしている状態で作業用フォルダを変更した場合は、リストをクリアしてから終了してください。

表示設定定タブ

認識結果の表示に関する設定をします。
認識結果表示フォント」には、設定されているフォント名が、そのフォントと、設定されている文字色で表示されます。

フォント設定(F)

認識結果で表示するフォントとフォントサイズを選択するダイアログを表示します。
※True Typeフォントのみ設定出来ます。

文字色設定(T)

認識結果で表示する文字の色を選択するダイアログを表示します。

改行マークを表示(E)

チェックすると、認識結果の表示で「改行マーク」を表示します。
「改行マーク」が表示されている場合、スクロールの際に画面がちらつきますので、それが気になる場合は非表示にしてください。また、「改行マーク」を表示しても選択することはできませんのでご注意ください。例えば、「検索」や「置換」を行う際に、「\r\n」を指定した場合に、ヒットはしますが選択状態にならないため、画面上では分かりませんのでご注意ください(改行マークが非表示の場合も同様です)。今後のバージョンアップで対応するかもしれません。

背景色

画像編集の際に、削除、移動、消しゴムツールなどで消去した際の背景色です。グレースケールに変換して画像を読み込んだ画像でも、ここで設定した色で消去されます。
背景色の設定(B)」ボタンをクリックすると、色を指定するダイアログが表示され、設定したい色を選ぶことができます。
初期設定では「白色」になっています。

Googleドライブ設定タブ

この設定は、インストールの設定で使用したタブです。 最初に設定したら、以降は設定する必要はありません。

注意事項

動作チェックは、作者が利用できる限られた環境でしか行っておりませんので、ご使用される環境によってはうまく動作しない場合があります。うまく動作しない場合は、ご協力頂ければできる限り対応致します。

Google ドライブのOCR機能は、画像の状態等によって改行位置がずれたり、誤認識することがありますが、本アプリは、Google ドライブの認識結果を取得しているだけですので、認識結果に関するお問い合わせには返答いたしかねます。ただし、明らかに本アプリに起因する誤った認識結果になる場合はご連絡ください。

著作権等

著作権

GoDriveOCRはフリーソフトウェアです。著作権はT.Ojimaが所有していますが、個人利用、商用利用問わず、無料でご利用いただけます。

本アプリで使用している「PDFアイコン」は、イラストセンター(R-DESIGN様作成)のアイコンを使用させて頂きました。

免責

本アプリを使用することにより発生した不利益については、作者は一切その責任を負わないものとします。

サポート

バグ報告・ご意見・ご感想などありましたら、こちらまでお願いします。できる限り対応致します。


E-Mail:oji-x@hotmail.co.jp

配布場所:http://ojimax.starfree.jp/